خوشه بندی سریهای زمانی با استفاده از الگوریتم ژنتیک
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
- author محمدصادق شیخایی
- adviser احمد عبداله زاده
- Number of pages: First 15 pages
- publication year 1386
abstract
در سالهای اخیر داده کاوی برروی سریهای زمانی توجه بسیاری را به خود جلب کرده است. شاید بتوان گفت از میان تمام تکنیکهای به کار برده شده برروی سریهای زمانی، خوشه بندی پر استفاده ترین تکنیک می باشد. خوشه بندی سریهای زمانی می تواند به دلایل مختلفی مانند یافتن الگوهای پنهان در داده ها و جستجوی شباهتها انجام شود. سریهای زمانی معمولاً دارای ابعاد طولانی هستند که این امر کار پردازش آنها را چه از نظر حافظه و چه از نظر زمان با مشکل روبرو می سازد. اما خوشبختانه به دلیل وابستگی زیاد بین مقادیر متوالی یک سری زمانی، تکنیکهای کاهش ابعاد داده راهکار مناسبی برای حل مشکل ابعاد آنها می باشد. با توجه به اینکه موضوع مورد بررسی ما خوشه بندی است، ما به بررسی تأثیر پنج روش مختلف کاهش ابعاد داده در خوشه بندی به وسیله الگوریتم k-means پرداخته و با انجام آزمایشات وسیع به این نتیجه رسیدیم که خوشه بندی برروی درصد بسیار کمی از مهمترین مولفه های استخراج شده از داده ها می تواند به نتایجی بسیار نزدیک به خوشه بندی برروی داده های اصلی منجر شود. همچنین با ایجاد دو تغییر اساسی در روش random projection، روش جدیدی به نام sample based projection برای کاهش ابعاد داده ارایه کردیم که در آزمایشات انجام شده، عملکرد خوبی از خود به نمایش گذاشت بطوری که وقتی ابعاد داده های کاهش یافته را کوچک (مثلاً کمتر از 8) در نظر گرفتیم، از پنج روش دیگر بجز روش principle component analysis بهتر عمل کرد. در ادامه الگوریتمی به نام aku-kmeans برای خوشه بندی سریهای زمانی ارایه کرده ایم که چه از نظر زمان اجرا و چه از نظر معیار icv (که از آن برای ارزیابی خوشه بندی استفاده کرده ایم) بهتر از الگوریتم k-means عمل می کند. در روش پیشنهاد شده، الگوریتم k-means برروی داده های بُعدی انجام می شود که عددی کوچک مانند 1، 2 و یا 4 می باشد. سپس بطور متوالی ابعاد داده ها از به افزایش یافته و الگوریتم k-means برروی داده های کاهش یافته جدید که دارای دقت بیشتری هستند انجام می شود. این روند آنقدر ادامه می یابد تا خوشه بندی بهتری پیدا نشود. از آنجایی که خوشه بندی یکی از مسایل بهینه سازی به شمار می آید از الگوریتم ژنتیک نیز می توان برای حل آن استفاده نمود. تا کنون چندین روش برای خوشه بندی داده ها با استفاده از الگوریتم ژنتیک ارایه شده است اما در هیچکدام از آنها توجهی به ابعاد داده ها نشده است. ما با به کار گیری ایده مطرح شده در الگوریتم aku-kmeans، یک الگوریتم ژنتیک برای خوشه بندی سریهای زمانی ارایه کردیم.
similar resources
یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر
The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...
full textسامانه طراحی سه بعدی لباس با استفاده از الگوریتم ژنتیک محاوره ای و خوشه بندی k-means
در عصر حاضر، با توسعه روزافزون فناوریهای رقمی و کاربرد آن در ارتقا و تسریع روند تولیدات هنری و نیز کاهش بهر هوری رو ش هایسنتی، کاربرد رایانه در طراحی لباس جایگاه ویژه ای یافته است. در این پژوهش، سامانه طراحی سه بعدی لباس با استفاده از الگوریتمژنتیک محاور های و خوشه بندی k-means ارائه شده است. با استفاده از نرم افزار طراحی لباس، اجزای لباس شنای زنانه شامل بالاتنه،میان تنه و پای...
full textسامانه طراحی سه بعدی لباس با استفاده از الگوریتم ژنتیک محاوره ای و خوشه بندی k-means
در عصر حاضر، با توسعه روزافزون فناوریهای رقمی و کاربرد آن در ارتقا و تسریع روند تولیدات هنری و نیز کاهش بهر هوری رو ش هایسنتی، کاربرد رایانه در طراحی لباس جایگاه ویژه ای یافته است. در این پژوهش، سامانه طراحی سه بعدی لباس با استفاده از الگوریتمژنتیک محاور های و خوشه بندی k-means ارائه شده است. با استفاده از نرم افزار طراحی لباس، اجزای لباس شنای زنانه ش...
full textبهینه سازی مسیر تردد سرویسهای حمل و نقل یک شرکت، با استفاده از خوشه بندی و الگوریتم ژنتیک
یکی از راهکارهای استفاده پایدار از منابع، سیستم حمل و نقل ادارات است. امروزه، سامانه های حمل و نقل به صورت دلخواه و با نظر افراد تعیین می شوند، در حالی که این انتخاب بهینه نیست. بنابراین باید روشی اتخاذ شود که بتوان این مسئله را به صورت کارآمد مدل کرد. از سوی دیگر در صورتی که تعداد کارمندان در یک شرکت زیاد باشد، فضای جستجوی مسئله افزایش پیدا کرده و استفاده از الگوریتمهای ریاضی مشکل است. به همین...
full textخوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک
مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشهبندی در دنیای واقعی، اغلب با مجموعه دادههایی مواجهیم که از ترکیبی از مقادیر عددی و دستهای تشکیل شدهاند. در حالیکه اغلب روشهای خوشهبندی موجود تنها بر روی دادههای عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی دادههای مختلط را ندارند. از س...
full textتعیین توصیفگرهای بهینه در خوشه بندی داده های لیدار با استفاده از الگوریتم ژنتیک
در سالهای اخیر، تکنولوژی لیدار به عنوان یک تکنولوژی کارآمد در کسب اطلاعات سهبعدی از زمین شناخته شده و هر روز بیش از پیش مورد توجه مهندسین و متخصصان مهندسی ژئوماتیک قرار میگیرد. استخراج عوارض از دادههای لیدار به عنوان یکی از مسائل مهم در پردازش این اطلاعات به شمار میآید. یکی از راههای استخراج اتوماتیک عوارض از این دادهها استفاده از الگوریتمهای خوشهبندی میباشد. تعیین روش بهینه خوشهبند...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023